AI为音频注入新质生产力 喜马拉雅重塑内容生态

  “人们往往会高估短期的变化,而低估长期的影响。”

  当微软因为生成式AI浪潮重新成为全球科技公司的“带头大哥”,比尔·盖茨多年前的这一判断,再一次在商业世界的浪潮变迁中被印证。

  2023年伊始,ChatGPT问世,一举震惊全球,在那半年时间里,对于AI威胁人类的担忧和恐惧引发了多轮讨论。甚至有许多知名人士起草公开信,要求暂停生成式人工智能的研发进展。

  但随着时间推移,对于新事物的最初恐惧也开始慢慢淡去。人们已经从到底是“有效加速”还是“超级对齐”的哲学争议中暂时脱身,因为,现实世界确实正在发生着巨大变化。

  而且,相比七八年前的那次AI风口更多还处于产业链上游,这一次,更多的普通人,已经开始真切感受到技术变革的力量——AI所带来的蝴蝶效应,正在向所有人徐徐张开它的翅膀,以喜马拉雅为代表的内容平台更是在借助AI重构其内容生态。由于语音数据相对容易收集和标注,也更易于处理,在音频赛道,AI的应用落地变得更为迅速。

  以音频行业为例,早先几年,AI演播的小说还“机器味”十足,如今喜马拉雅的音频技术已经可以让AI多角色、带感情的演播有声书、广播剧。AI俨然已成为时代变革中的新质生产力


  AI为音频注入新质生产力

  众所周知,高质量的数据集是将AI塑造成可靠的解释器的训练燃料,从庞大的数据集中探索并获得有意义的见解以推动AI不断发展。

  喜马拉雅拥有中国最全面的音频内容生态,其中包括体量最大的音频内容库及数量最多的音频内容创作者。据公开数据显示,截至2023年12月,喜马拉雅拥有约4.9亿条音频内容,总内容时长为36亿分钟。这使得喜马拉雅在AI时代能够轻松获取海量且多样化的在线音频内容以不断演进其AI能力,这也是喜马拉雅在AI时代的竞争优势。

  全球知名AI学者、斯坦福大学计算机科学教授李飞飞说,“AI不再是辅助工具,而是创新伙伴。”她认为,随着深度学习和自然语言处理技术的成熟,AI已经能够理解复杂的人类语言,并在此基础上进行创造性地输出。

  据悉,喜马拉雅专门成立“珠峰实验室”,通过研发出“珠峰音频AI模型”,引入由AI驱动的以用户为导向的“新质生产力”新范式。喜马拉雅正在将自己打造成具有AI能力的强大技术驱动的平台,AI已经在其内容生产、业务运营等各方面发挥着重要作用。

  喜马拉雅正在利用AI技术驱动有声读物的制作,不论是AI单独创作,还是与人类共同创作,AI极大提升了内容创作效率。喜马拉雅还建立了包含535种合成声音组成的音色库,以适配不同情景下展示人类的感受及情感。AI贯穿着有声读物的预录制、录制、后期等全过程,相比于人工创作过程的时间,AI的创作时间提效超过50倍;而由AI制作人有限参与的AI精制作,相比于人工创作提效超过3倍。


  在2024年1月举办的“戏精大汇”有声主播年度盛典上,喜马拉雅为创作者颁出“最佳AI制作人”“最佳AI制作团队”奖项,获得“最佳AI制作团队”的“嫣然有声”一年左右制作专辑超370张,其中120多张播放量破百万,16长张专辑播放量破千万,总播放量突破7亿,粉丝数量突破100万。

  内容创作者自身也在积极拥抱AI,借助AI降本增效。比如,大部分的真人主播在制作一张专辑时,从专辑封面图、简介大图,再到推广物料图等等,需要外包给外部工作室,费用至少需要1000元。喜马拉雅通过训练AI来助力主播制作一张专辑在各环节需要的图片,主播专辑图片设计成本从几千降到几毛,而且AI的效率也很高,几分钟就能完成图片生成。

  AI也在驱动播客创作变革,有位播客主潇潇使用完喜马拉雅智能创作工具“音剪”后说:“超级难剪辑的100分钟音频,花了10分钟不到就处理完了,把我们嘴瓢的地方都删掉了。”后期制作是有声内容作品的重要一环,喜马拉雅推出专有的一站式AI音频制作工具“音剪”,融入各种AI“黑科技”功能,极大缩短创作者后期制作时间,提升创作效率,也从技术层面降低了创作门槛。

  “AI将帮助人类创作者突破创意的极限,而不是取代他们。”谷歌AI部门负责人杰夫·迪恩此前在一次公开讲话中表达了和中国同行类似的观点。在他看来,未来的创作模式将是人机协同,AI负责处理重复性高、耗时长的任务,而人类则专注于创意构思和情感表达,共同创造出更加丰富多元的内容。

  AI正在带来内容生产力的跳跃式发展,从生产侧到消费侧全面重塑内容生态。

  AI重塑内容生态

  作为音频行业领头羊企业,喜马拉雅曾首创PUGC内容生产方式,并通过“PGC+PUGC+UGC”三位一体战略,实现了从头部专业生产内容到长尾用户生产内容的音频内容全方位覆盖,打造出自己的“声音宇宙”。

  随着AI时代到来,喜马拉雅不仅将AI技术深入应用于PGC、PUGC、UGC的创作全流程,AIGC本身也成为一大内容生产方式。截至2023年12月,喜马拉雅平台AIGC内容达2.4亿分钟,占平台音频内容的6.6%。

  在内容生态体系中,内容制作成本高昂一直是众多内容平台的一大症结,从版权采买,到匹配创作者,再到漫长的制作周期,每一环都是人力和成本的堆积。喜马拉雅通过AI赋能创作者和平台,以提升内容生产速度和内容质量,形成像“AI制作人”一样的人机协同。在喜马拉雅,过去平均制作一本有声书少则十几天多则几个月,现在慢则一两天,快则十几个小时即能完成。

  据悉,喜马拉雅还利用大数据分析能力及AI技术,建立了A+平台,将其PUGC创作者与高质量版权内容进行高效撮合,进而产生出极具吸引力的内容。数据显示,2022年自喜马拉雅平台获得超过10万元报酬的PUGC创作者中,有94.8%于2023年继续创作并上传音频内容,AI赋能极大提升了创作者粘性。


  直播是喜马拉雅四大收入来源之一,是其音频内容生态的重要组成部分。喜马拉雅也为直播主播推出“AI直播助手”,协助主播在直播间的实时沟通与用户互动。

  盘古智库高级研究员江瀚认为,AI技术对以喜马拉雅为代表的音频公司影响深远,从内容生产侧,AI能够提升内容生产效率和质量,实现音频内容的快速生成和优化,降低内容成本的同时,提升内容吸引力;在内容消费侧,借助AI,喜马拉雅能实现更精准的用户推荐和个性化服务,提升用户体验和粘性;在商业化方面,AI还可以助力喜马拉雅开拓新的商业模式和盈利空间,通过智能语音广告等形式实现更健康的商业变现。

  在AI重塑内容生态循环中,技术的进步从来就不是孤立发生,而是与创作者的需求、用户的反馈以及平台的发展紧密相连。

  创作者在使用AI工具进行内容创作的过程中,产生的数据被AI系统学习和分析,从而不断优化和调整其算法,以更好地满足创作者的需求。与此同时,用户对AI创作内容的反馈,对于生态循环同样至关重要。用户习惯、喜好和评价等数据,帮助AI更精准地定制内容。而在分发推荐环节,通过分析用户数据,AI能够实现智能推荐,将合适的内容推送给感兴趣的用户。这种个性化的分发机制,不仅提高了用户的满意度,也增加了内容的网曝率和传播力。

原标题:【AI为音频注入新质生产力 喜马拉雅重塑内容生态
内容摘要:“人们往往会高估短期的变化,而低估长期的影响。” 当微软因为生成式AI浪潮重新成为全球科技公司的“带头大哥”,比尔·盖茨多年前的这一判断,再一次在商业世界的浪潮变迁中被印证 ...
文章网址:https://www.doukela.com/keji/280033.html;
免责声明:抖客网转载此文目的在于传递更多信息,不代表本网的观点和立场。文章内容仅供参考,不构成投资建议。如果您发现网站上有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。
上一篇:钉钉宣布对所有大模型开放 构建中国最开放AI生态
下一篇:自动续费未显著提示 网易云音乐被指“套路”消费者